本文着重于根据数据包输送比率(PDR)(即,在远程广阔的区域(Lorawan)中通过End Devices(EDS)发送)的数据包数量来改善资源分配算法。设置传输参数会显着影响PDR。我们采用强化学习(RL)提出了一种资源分配算法,该算法使ED可以以分布式方式配置其传输参数。我们将资源分配问题建模为多臂强盗(MAB),然后通过提出一种名为Mix-MAB的两相算法来解决它,该算法由探索和开发(EXP3)和连续消除(SE)组成,该算法由指数重量组成(SE)算法。我们通过仿真结果评估混合MAB性能,并将其与其他现有方法进行比较。数值结果表明,就收敛时间和PDR而言,所提出的解决方案的性能优于现有方案。
translated by 谷歌翻译